Тема 2.9. - критерій Пірсона
Призначення критерію. Критерій використовується:
1) для співставлення емпіричного розподілу ознаки з теоретичним-рівномірним, нормальним чи якимось іншим;
2) для співставлення двох, трьох і більше емпіричних розподілів однієї і тієї ж самої ознаки.
Описання критерію. Критерій відповідає на питання про те, чи з однаковою частотою зустрічаються різні значення ознаки в емпіричному і теоретичному розподілах або у двох і більше емпіричних розподілах.
Перевага методу полягає в тому, що він дозволяє співставляти розподіли ознак, представлених в будь-якій школі, починаючи з шкали найменувань.
При співставленні емпіричного розподілу з теоретичним ми визначаємо ступінь розбіжності між емпіричним і теоретичними частотами.
При співставленні двох емпіричних розподілів ми визначаємо ступінь розбіжності між емпіричними частотами і теоретичними частотами, які спостерігались би у випадку спів падання двох цих емпіричних частот.
Чим більша розбіжність між двома співставлюваними розподілами, тим більше емпіричне значення .
Гіпотези. Можливі кілька варіантів гіпотез, у залежності від задач, які ми ставимо перед собою.
Перший варіант:
Отриманий емпіричний розподіл ознаки, не відрізняється від теоретичного (якого) розподілу.
Отриманий емпіричний розподіл ознаки відрізняється від теоретичного розподілу.
Другий варіант:
Емпіричний розподіл 1 не відрізняється від емпіричного розподілу 2.
Емпіричний розподіл 1відрізняється від емпіричного розподілу 2.
Третій варіант:
Емпіричні розподіли 1,2,3,... не відрізняються між собою.
Емпіричні розподіли 1,2,3,... відрізняються між собою.
Критерій дозволяє перевірити всі три варіанти гіпотез.
Обмеження критерію
1. Об’єм вибірки має бути достатньо великим: . При критерій дає досить наближенні значення. Точність критерію підвищується при великих .
2. Теоретична частота для кожної комірки не має бути менша 5:
3. Вибрані розряди мають „вичерпувати” всі розподіли, тобто охоплювати увесь діапазон варіативності ознак.
4. Необхідно внести „поправку на неперервність” при „співставленні” розподілів ознак, які приймають всього два значення.
5. Розряди мають бути неперехресними: якщо спостереження віднесено до одного розряду, то воно уже не може бути віднесено до другого розряду.
Сума спостережень у розрядах має дорівнювати загальній кількості спостережень.
Алгоритм
Розрахунок критерію .
1. Занести у таблицю назви розрядів і відповідні їм емпіричні частоти (перший стовпець).
2. Рядом з кожною емпіричною частотою записати теоретичну частоту (другий стовпець).
3. Підрахувати різниці між емпіричною і теоретичною частотою по кожному розряду (стрічкою) і записати їх у третій стовпець.
4. Визначити число ступенів вільності за формулою: де – кількість розрядів. Якщо , внести поправку на „неперервність”.
5. Піднести до квадрату одержані різниці і занести їх у четвертий стовпець.
6. Розділити одержані квадрати різниць на теоретичну частоту і записати результати у п’ятий стовпець.
7. Просумувати значення п’ятого стовпця. Одержану суму позначити як .
8. Знайти за таблицями критичне значення для даного числа ступенів вільності. Якщо менше критичного значення, розбіжності між розподілами статистично недостовірні. Якщо дорівнює критичному значенню або більше його, розбіжності між розподілами статистично достовірні:
Розрахунок теоретичних частот
1. Теоретична частота при співставленні емпіричного розподілу з рівномірним визначається за формулою:
де – кількість спостережень; – кількість розрядів ознаки.
2. Теоретична частота при співставленні емпіричного розподілу з нормальним визначається за формулами:
а) ,
де – нормоване відхилення; – середнє квадратичне відхилення; – довжина інтервалу.
б)
де – теоретичні ймовірності попадання в інтервал – функція Лапласа, значення якої знаходять з таблиць.
3. Для співставлення двох і більше емпіричних розподілів теоретичну частоту обчислюють за формулою:
.
25 26 27 28 29 30 Наверх ↑